逆变换采样

由[0,1]之间的均匀随机数和被采样样本集分布的CDF来实现随机的抽取

逆变换采样是一种从特定概率分布中生成随机样本的技术。这个方法基于概率分布的累积分布函数(CDF),它是一种用来描述变量取值小于等于某个值的概率。通过逆变换采样,我们可以从一个简单的均匀分布生成随机数,并将这些数转换成目标分布的随机样本

适用场景

  • CDF已知
  • CDF的反函数(逆变换存在)

缺点:

  • 对于不太常见的,不容易求CDF的,CDF反函数不存在的分布用不了逆变换采样。

基本原理

逆变换采样的原理可以通过以下几个步骤来解释:

  • 定义累积分布函数(CDF):首先,确定你需要采样的概率分布的累积分布函数 𝐹(𝑥)。这个函数给出了随机变量小于或等于 𝑥 的概率。
  • 生成均匀随机数:从 [0,1][0,1] 区间内生成一个均匀分布的随机数 𝑢。
  • 应用逆函数:找到CDF的逆函数 𝐹−1,并将均匀随机数 𝑢 作为输入,得到 𝑥=𝐹−1(𝑢)。这个 𝑥 就是目标分布的一个随机样本。

生动形象的例子

想象你在一个游乐园,那里有一个“幸运转盘”游戏,转盘被分成不等的几个部分,每个部分代表一个奖项,且中奖的概率不同。你的任务是模拟这个游戏,生成一个随机奖项。

假设转盘有三个部分,中奖概率分别是30%、20%和50%。首先,我们需要确定每个奖项的概率区间:

  • 第一个奖项:0到0.3
  • 第二个奖项:0.3到0.5
  • 第三个奖项:0.5到1.0

累积分布函数(CDF)可以表示为:

  • 𝐹(𝑥)=0.3 当 𝑥 是第一个奖项
  • 𝐹(𝑥)=0.5当 𝑥 是第二个奖项
  • 𝐹(𝑥)=1.0 当 𝑥 是第三个奖项

现在,你从[0, 1]区间抽一个随机数,比如0.42。根据我们的CDF,0.42落在0.3和0.5之间,因此这次抽取的是第二个奖项。

通过这个过程,你可以从任意复杂的分布中抽取随机样本,只需生成一个简单的均匀分布随机数,并通过逆CDF将其转换为目标分布的样本。这种方法在计算机模拟和统计学中非常有用,尤其是在你不能直接从分布中抽样时。